Wpływ Social Media na życia studentów

1 Wprowadzenie

Celem niniejszego raportu jest analiza wpływu social media na życia studentów. Raport zawiera przegląd kluczowych danych, ich wizualizacje oraz obszerne wnioski. Zbiór danych zawiera 705 wierszy oraz 13kolumn.

1.1 Opis danych

Dane zawierają następujące kolumny:

2 Porządkowanie danych

2.1 Braki danych

W danych znajduje się 100 % kompletnych wartości.

2.2 Walidacja danych

  • czy wiek przyjmuje wartości od 16 - 25?
  • czy godziny przyjmują wartości 0 - 24?
  • czy wszystkie wartości liczbowe są większe od 0?
  • czy mental health score i addicted score przyjmują wartości 1 - 10?
  • płeć - kobieta lub mężczyzna?
  • academic level - high school, undergraduate, graduate?
  • relationship status - single, in relationship, complicated?
  • affects academic performance - yes/no?
reguly <- validator(
Age >= 16 & Age <= 25,
Gender %in% c("Female", "Male"),
Academic_Level  %in% c("High School", "Undergraduate", "Graduate"),
Avg_Daily_Usage_Hours > 0 & Avg_Daily_Usage_Hours < 24,
Affects_Academic_Performance %in% c("Yes", "No"),
Sleep_Hours_Per_Night >= 0 & Sleep_Hours_Per_Night <= 24,
Mental_Health_Score >= 1 & Mental_Health_Score<=10,
Relationship_Status %in% c("In Relationship", "Single", "Complicated"),
Addicted_Score >= 1 & Addicted_Score <= 10
)
cf <- confront(dane, reguly, key="Student_ID")

barplot(cf)
## Warning: The 'barplot' method for confrontation objects is deprecated. Use
## 'plot' instead

3 Wizualizacja danych

3.1 Charakterystyka demograficzna badanej grupy studenckiej

3.1.1 Rozkład Płci i Poziomu Akademickiego

dane$Academic_Level <- factor(dane$Academic_Level, 
                            levels = c("High School", "Undergraduate", "Graduate"))
dane$Gender <- factor(dane$Gender,
                  levels = c("Male", "Female")
)

ggplot(dane, aes(x = Academic_Level, fill=Gender)) +
  geom_bar(position = "dodge") +
  labs(title = "Rozkład płci i poziomu akademickiego",
       x = "Poziom akademicki",
       y = "Liczba studentów") +
  theme_minimal()

3.1.2 Wiek badanych

ggplot(dane, aes(x = Age)) +
  geom_histogram(binwidth = 0.5, fill = "skyblue", color = "black") +
  labs(title = "Wiek badanych studentów",
       x = "Wiek",
       y = "Liczba studentów") +
  theme_minimal()

3.2 Intensywność Używania Social Mediów

3.2.1 Średni czas użycia

ggplot(dane, aes(x = Avg_Daily_Usage_Hours)) +
  geom_histogram(binwidth = 1, fill = "#9f2042", color = "#6c0d27") +
  labs(title = "Średni czas użycia social mediów dziennie",
       x = "Średni czas użycia (h)",
       y = "Liczba studentów") +
  theme_minimal()

3.2.2 Najczęściej używane platformy

dane %>%
mutate(top_5 = fct_lump_n(Most_Used_Platform, n = 4, other_level = "Inne")) %>%
  ggplot(aes(x = top_5)) +
  geom_bar(fill = "#6c0d27") +
  labs(title = "Najczęściej używane platformy social media",
       x = "Platforma",
       y = "Liczba studentów") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

3.3 Wpływ social mediów na wyniki akademickie

wykres <- dane %>%
  count(Addicted_Score) %>%
  ggplot(aes( x = Addicted_Score, y=n)) +
  geom_point(color= "blue")+
  geom_line(color= "blue")+
  labs(title = "Poziom uzależnienia uczniów",
       x = "Poziom uzależnienia",
       y = "Liczba uczniów") +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5)
  )
plotly:: ggplotly(wykres)

Największa liczba badanych koncentruje się na umiarkowanych i wyższych poziomach uzależnienia, co wskazuje na powszechność intensywnego korzystania z mediów społecznościowych w badanej grupie.

ggplot(dane, aes(x = Affects_Academic_Performance)) +
  geom_bar(fill = "#6c0d27", width= 0.5)+
  scale_x_discrete(
    labels = c(
      "Yes" = "Tak",
      "No"  = "Nie"
    )
  ) +
  labs(title = "Wpływ social mediów na wyniki akademickie",
       x = "Czy social media wpływają na wyniki akademickie?", 
       y = "Liczba studentów")+
         theme_minimal()+
   theme(
    plot.title = element_text(hjust = 0.5)
  )

Zdecydowana większość badanych zadeklarowała, że korzystanie z social mediów wpływa na ich osiągnięcia akademickie, podczas gdy mniejsza część respondentów nie dostrzega takiego wpływu. Uzyskane wyniki sugerują, że studenci w dużym stopniu są świadomi oddziaływania mediów społecznościowych na wyniki w nauce.

3.4 Social media a zdrowie psychiczne

ggplot(dane, aes(x= Avg_Daily_Usage_Hours, y = Mental_Health_Score))+
geom_smooth(method = "lm", se = F) +
 labs(
    title = "Zależność między uzależnieniem od social mediów a zdrowiem psychicznym",
    x = "Poziom uzależnienia",
    y = "Poziom zdrowia psychicznego"
  ) +
  theme_minimal()+
  theme(
    plot.title = element_text(hjust = 0.5)
  )
## `geom_smooth()` using formula = 'y ~ x'

Wykres przedstawia linię regresji liniowej obrazującą zależność pomiędzy poziomem uzależnienia od social mediów a zdrowiem psychicznym studentów. Wraz ze wzrostem poziomu uzależnienia obserwuje się spadek wyników zdrowia psychicznego.

3.5 Wpływ social mediów na relacje interpersonalne

ggplot(dane, aes(x = Avg_Daily_Usage_Hours, y = Conflicts_Over_Social_Media)) +
  geom_point(alpha = 0.5) +
  geom_smooth(method = "lm", col = "blue") +
  labs(title = "Korelacja czasu używania social mediów z liczbą konfliktów") +
  theme_light()
## `geom_smooth()` using formula = 'y ~ x'

Wykres przedstawia zależność pomiędzy przeciętną liczbą godzin używania social mediów a liczbą konfliktów spowodanych social mediami wraz z przeiwdywaną linią trendu. Przy wzroście średniego dziennego użytkowania social mediów zauważa się również wzrost liczby konfliktów w tym temacie.

4 Statystyki opisowe

4.1 Tendencja centralna dla zmiennej Addicted Score

platform boxplot histogram points1
Facebook
Instagram
KakaoTalk
LINE
LinkedIn
Snapchat
TikTok
Twitter
VKontakte
WeChat
WhatsApp
YouTube
raport <- list("Addicted Score" = 
                 list("Min"= ~ min(Addicted_Score), 
                      "Max"= ~ max(Addicted_Score), 
                      "Q1"= ~ quantile(Addicted_Score,0.25), 
                      "Mediana"= ~ round(median(Addicted_Score),2), 
                      "Q3"= ~ quantile(Addicted_Score,0.75), 
                      "Średnia"= ~ round(mean(Addicted_Score),2), 
                      "Odch. std."= ~ round(sd(Addicted_Score),2), 
                      "IQR"= ~ round(IQR(Addicted_Score),2), 
                      "Odch. ćwiartkowe"=~round(IQR(Addicted_Score)/2,2), 
                      "Odch. std. w %"=~round((sd(Addicted_Score)/mean(Addicted_Score)),2), "Odch. ćwiartkowe w %"=~round((IQR(Addicted_Score)/median(Addicted_Score)),2), "Skośność"=~round(skew(Addicted_Score),2), "Kurtoza"=~round(kurtosi(Addicted_Score),2) ))
tabela_gender <- dane %>%
  group_by(Gender) %>%
  summarise(
    Min = min(Addicted_Score),
    Q1 = quantile(Addicted_Score, 0.25),
    Mediana = median(Addicted_Score),
    Q3 = quantile(Addicted_Score, 0.75),
    Max = max(Addicted_Score),
    Średnia = mean(Addicted_Score),
    SD = sd(Addicted_Score),
    Skośność = psych::skew(Addicted_Score),
    Kurtoza = psych::kurtosi(Addicted_Score)
  )

kable(tabela_gender,
      digits = 2,
      caption = "Tabela 4.2. Statystyki opisowe Addicted_Score w podziale na płeć") %>%
  kable_paper("striped", full_width = FALSE)
Tabela 4.2. Statystyki opisowe Addicted_Score w podziale na płeć
Gender Min Q1 Mediana Q3 Max Średnia SD Skośność Kurtoza
Male 2 5 7 7 9 6.36 1.45 -0.45 -0.82
Female 3 5 7 8 9 6.52 1.71 -0.24 -1.05